39 research outputs found
Evaluation Study of a Distributed Caching Based on Query Similarity in a P2P Network
ABSTRACT Several caching techniques have been used to reduce the bandwidth consumption and to provide faster answers in P2P systems. In this paper, we address the problem of reducing unnecessary traffic in the Hybrid Overlay Network (HON), which consists in organizing peers and data in an n-dimensional feature space for efficient similarity search. We propose a distributed caching schema that group similar queries to increase the success hit and avoid redundancy. We show through extensive simulations that caching in HON decreases significantly the query scope improving search performance
A marked point process model with strong prior shape information for extraction of multiple, arbitrarily-shaped objects
We define a method for incorporating strong prior shape information into a recently extended Markov point process model for the extraction of arbitrarily-shaped objects from images. To estimate the optimal configuration of objects, the process is sampled using a Markov chain based on a stochastic birth-and-death process defined in a space of multiple objects. The single objects considered are defined by both the image data and the prior information in a way that controls the computational complexity of the estimation problem. The method is tested via experiments on a very high resolution aerial image of a scene composed of tree crowns
SemIndex: Semantic-Aware Inverted Index
[email protected] paper focuses on the important problem of semanticaware search in textual (structured, semi-structured, NoSQL) databases. This problem has emerged as a required extension of the standard containment keyword based query to meet user needs in textual databases and IR applications. We provide here a new approach, called SemIndex, that extends the standard inverted index by constructing a tight coupling inverted index graph that combines two main resources: a general purpose semantic network, and a standard inverted index on a collection of textual data. We also provide an extended query model and related processing algorithms with the help of SemIndex. To investigate its effectiveness, we set up experiments to test the performance of SemIndex. Preliminary results have demonstrated the effectiveness, scalability and optimality of our approach.This study is partly funded by: Bourgogne Region program, CNRS, and STIC
AmSud project Geo-Climate XMine, and LAU grant SOERC-1314T012.Revisión por pare
Track on Web Computing and Applications WECA: Editorial
International audienc
Interoperabilité sémantique des systèmes d'information géographique (une approche basée sur la médiation de contexte)
DIJON-BU Sciences Economie (212312102) / SudocSudocFranceF
Dimensionality Reduction in a P2P System
The requirements imposed on information retrieval systems are increasing
steadily. The vast number of documents in today’s large databases and
especially on World Wide Web causes notable problems when searching for
concrete information. It is difficult to find satisfactory information that
accurately matches user information needs even if it is present in the
database. One of the key elements when searching the web is proper formulation
of user queries. Search effectiveness can be seen as the accuracy of matching
user information needs against the retrieved information. Personalized search
applications can notably contribute to the improvement of web search
effectiveness. It has been shown, that genetic programming can evolve search
queries towards users interests captured by the means of relevance. In this
paper, we propose user modelling technique based on relevance estimation and
provide experimental results in web search framework with evolutionary query
optimization
Réécriture de requêtes mutimédia
La recherche d information subit depuis quelques années une mutation significative liée aux technologies Web et aux dispositifs électroniques personnels qui ont permis à toute personne d être connectée à la toile à tout moment et depuis pratiquement n importe quel endroit. Les applications de recherche d information actuelles se doivent d adapter son fonctionnement selon l utilisateur et son contexte, puisque chacun a ses propres besoins, intérêts, contraintes, et préférences. Plusieurs techniques d adaptation ont vu le jour, en particulier la réécriture de requête permettant de modifier certains prédicats initiaux afin de mieux répondre aux attentes de l utilisateur. Cependant, la plupart de ces techniques ne sont pas appropriées à la recherche d information multimédia, de plus en plus produite, partagée, et recherchée par les utilisateurs. Cela est principalement lié: 1-) à la complexité de la description et de la représentation du contenu multimédia pouvant être décrit par des propriétés sémantiques, physiques (couleurs, formes, textures, etc.), spatiales et temporelles, etc. 2)- à l ambigüité causée par le pouvoir d expression des langages d interrogation proposés pour la recherche d information multimédia, et 3)- à la prise partielle des préférences de chaque utilisateur. Nous proposons, dans cette thèse, une approche de réécriture de requêtes multimédia qui permet à la fois de considérer la spécificité de chaque propriété multimédia impliquée dans la requête et le profil de l utilisateur. S articulant autour du concept de voisinage que nous définissons ici, notre approche comporte trois phases : la pré-réécriture qui permet de définir des voisinages pondérés des valeurs à réécrire, la réécriture brute dans laquelle nous définissons une fonction de relaxation de valeurs et nous intégrons les contraintes de l utilisateur en appliquant une fonction de contrôle, et la post-réécriture qui a pour mission d adapter le résultat et le rendre plus pertinent selon les besoins de l utilisateur. Plusieurs prototypes ont été implémentés ainsi qu une panoplie de tests expérimentaux ayant été menés dans le but de valider notre proposition.DIJON-BU Sciences Economie (212312102) / SudocSudocFranceF
DECA (UNE APPROCHE SEMANTIQUE ET A BASE D'AGENTS POUR LA COOPERATION DE SYSTEMES D'INFORMATIONS)
DIJON-BU Sciences Economie (212312102) / SudocSudocFranceF